\section{标 准 形}


\begin{frame}{本节概要}
  \begin{enumerate}
    \item 我们想用非退化的线性替换化简二次型。
      我们心目中的简单形式是平方和的形式，这种形式的二次型一一对应于对角矩阵。
      事实上，二次型总可经非退化的线性替换化为平方和的形式，
      即所谓的标准形 (P141, 定理1)。
    \item 在\S1中我们已知，二次型一一对应于对称矩阵，
      二次型上的非退化的线性替换这个操作对应于对称矩阵上的合同变换这个操作。
      因此用矩阵的语言来描述定理1就是对称矩阵可以合同化为对角矩阵 (P144, 定理2)。
      定理1和定理2是等价的。
    \item 可以 (多次) 用中学学过的配方法把二次型化为标准形，
      也可以通过 (多次) 合同变换二次型的矩阵到对角矩阵来实现化二次型为标准形。
    \item 配方法如下进行：
用非退化的线性替换把$f(x_1, \cdots, x_n)$写成
$b_1 y_1^2+g(y_2, \cdots, y_n)$ (有平方项时) 或 
$y_1^2-y_2^2+g(y_3,\cdots,y_n)$ (无平方项时) 的形式（注意到二次型$g$中的文字更少），
  然后对二次型$g$类似地操作，如此重复下去。
\item (这块内容需要看课件) 
  至于合同变换二次型的矩阵这种方法，我们会讲到对称版本的初等变换。
  %初等变换简单且有效。
  合同变换对称矩阵为对角矩阵相当于用一系列
对称版本的初等变换把对称矩阵化为对角矩阵。对角化对称矩阵$A$的过程如下：
  先把$A$通过一系列对称版本的初等变换化成$\begin{pmatrix}
    a_{11}' \\ & A'
  \end{pmatrix}$的形式，
  接着对$A'$做类似的过程，不断地重复下去，直到把$A$变成对角阵。
\item (这块内容需要看课件) 我们还会讲到
  对称版本的分块形式的初等变换。
  %尤其是在一些抽象的讨论里，有时用上对称版本的分块形式的初等变换会很方便。
  \end{enumerate}
\end{frame}

\begin{frame}{二次型可经非退化的线性替换化为标准形}
\pause
可以认为，二次型中最简单的一种是只包含平方项的二次型
\begin{equation}
d_{1} x_{1}^{2}+d_{2} x_{2}^{2}+\cdots+d_{n} x_{n}^{2} .
\end{equation}

\pause
\begin{theorem}
  数域 $P$ 上任意二次型可经非退化的线性替换变成平方和形式（称为该二次型的\emph{标准形}）或\emph{对角形} (diagonal form)。
  \end{theorem}

\pause
不难看出，二次型 (1) 的矩阵是对角矩阵， 
\pause
即
\[
d_{1} x_{1}^{2}+d_{2} x_{2}^{2}+\cdots+d_{n} x_{n}^{2}=\left(x_{1}, x_{2}, \cdots, x_{n}\right)\left(\begin{array}{cccc}
d_{1} &  &  &  \\
 & d_{2} &  &  \\
 &  &\ddots &  \\
 &  &  & d_{n}
\end{array}\right)\left(\begin{array}{c}
x_{1} \\
x_{2} \\
\vdots \\
x_{n}
\end{array}\right) .
\]
\pause
反过来，矩阵为对角形的二次型就只含有平方项。
\pause
按上一节的讨论， 经过非退化的线性替换， 二次型的矩阵变到一个合同的矩阵， 
\pause
因此， 用矩阵的语言， 上述定理可以叙述为
\pause
\begin{theorem}
在数域 $P$ 上，任意一个对称矩阵都合同于一对角矩阵。
\end{theorem}

\pause
也就是说， 对任意的对称矩阵 $A$, 存在可逆矩阵 $C$ 使得
$C^{\rT} A C$
是对角矩阵。
 \end{frame}



\begin{frame}{配方法化二次型为标准形（举例）}
  \pause
  我们先通过例子来说明我们要处理的情况。
  我们从最简单的例子开始。
\pause
  \begin{example}
  \begin{enumerate}
\pause
    \item 考虑$f(x_1,x_2)=x_1^2+2x_1x_2$. 
      \pause
      显然我们有
      \[
        f(x_1,x_2)=(x_1^2+2x_1x_2+x_2^2)-x_2^2=(x_1+x_2)^2-x_2^2.
      \]
      \pause
      这样令
      \[
        y_1=x_1+x_2, \quad y_2=x_2,
      \]
      \pause
      或者说，
      \[
        \begin{cases}
          x_1= y_1-y_2 \\
          x_2= y_2,
        \end{cases}
      \]
\pause
      那么$f$变成了$y_1^2-y_2^2$.
      \pause
    \item 考虑$f(x_1,x_2)=2x_1x_2$. 
\pause
      令
      \[
        \begin{pmatrix}
          x_1 \\ x_2
        \end{pmatrix}=
        \begin{pmatrix}
          y_1+y_2 \\
          y_1-y_2
        \end{pmatrix}
        \pause
        =\begin{pmatrix}
          1 & 1 \\
          1 & -1
        \end{pmatrix}\begin{pmatrix}
          y_1 \\
          y_2
        \end{pmatrix},
      \]
\pause
      那么$f$被化成了$2y_1^2-2y_2^2$.
  \end{enumerate}
  \end{example}

\end{frame}

\begin{frame}
  \begin{example}\label{1C3}
考虑二次型
\[
f\left(x_{1}, x_{2}, x_{3}\right)=2 x_{1} x_{2}+2 x_{1} x_{3}-6 x_{2} x_{3}.
\]
\pause
令
\[
  \left\{\begin{array}{l}
        x_{1}=y_{1}+y_{2} \\
        x_{2}=y_{1}-y_{2} \\
        x_{3}=y_{3},
    \end{array}\right.
  \]
\pause
则
\[
  \begin{aligned}
    f\left(x_{1}, x_{2}, x_{3}\right) & 
\pause
    =2\left(y_{1}+y_{2}\right)\left(y_{1}-y_{2}\right)+2\left(y_{1}+y_{2}\right) y_{3}-6\left(y_{1}-y_{2}\right) y_{3} \\
\pause
  & =2 y_{1}^{2}-2 y_{2}^{2}-4 y_{1} y_{3}+8 y_{2} y_{3}\\
\pause
  &= 2\left(y_{1}-y_{3}\right)^{2}-2 y_{3}^{2}-2 y_{2}^{2}+8 y_{2} y_{3} \\
\pause
%&= 2\left(y_{1}-y_{3}\right)^{2} -2(y_2^2-4y_2y_3+4y_3^2)+6y_3^2 \\
&= 2\left(y_{1}-y_{3}\right)^{2} - 2(y_2-2y_3)^2+6y_3^2.
\end{aligned}
\]
\pause
  这样，令
    \[
  \left\{\begin{array}{l}
        w_{1}=y_{1}-y_{3} \\
        w_{2}=y_2-2y_3 \\
        w_{3}=y_{3},
    \end{array}\right.
  \]

\end{example}
\end{frame}

\begin{frame}{}

  \addtocounter{theorem}{-1}
  \begin{example}[续]
  即（通过回代求解把$y_1,y_2,y_3$表示成$w_1,w_2,w_3$的线性组合）
\[
  \left\{\begin{array}{l}
        y_{1}=w_{1}+w_3 \\
      y_{2}=w_2+2w_3 \\
      y_{3}=w_{3},
\end{array}\right.
\]
\pause
则
\[
  f\left(x_{1}, x_{2}, x_{3}\right) = 2w_1^2-2w_2^2+6w_3^2
\]
是平方和，
\pause
且这几次线性替换合并的结果为
\pause
\[
\begin{aligned}
\pause
    \begin{pmatrix}
      x_1 \\ x_2 \\x_3
    \end{pmatrix}
\pause
    &= 
    \begin{pmatrix}
      y_1+y_2\\ y_2-y_2 \\y_3
    \end{pmatrix}
\pause
    = 
    \begin{pmatrix}
      w_1+w_2+3w_3 \\
  w_1-w_2-w_3 \\
    w_3
  \end{pmatrix}\\
\pause
&= 
  \begin{pmatrix}
    1 & 1 & 3 \\
    1 & -1 & -1 \\
    0 & 0 & 1
  \end{pmatrix}\begin{pmatrix}
    w_1 \\ w_2 \\ w_3
  \end{pmatrix}.
\end{aligned}
\]
  \end{example}
 \end{frame}


\begin{frame}{标准形存在的证明（配方法）}
  \pause
  任给一个二次型$f(x_1,\cdots,x_n)$, 我们可以用非退化的线性替换把$f(x_1, \cdots, x_n)$写成
  $b_1 y_1^2+g(y_2, \cdots, y_n)$的形式（注意到二次型$g$中的文字更少）。
  \pause
 这是配方法证明标准形存在的关键步骤。承认这点，那么容易用数学归纳法证得二次型可以经非退化的线性替换化为标准形。
\pause
  要实现这个关键步骤，我们分有平方项、无平方项这两种情形分别讨论：
  \begin{block}{配方法}
  \begin{enumerate}
    \item 情形 1：某个$a_{ii}\neq 0$. 
\pause
不妨设$a_{11}\neq 0$ (因为交换文字$x_1,x_i$的顺序这个变换是可逆的)。
\pause
      那么
      \[
  \begin{aligned}
    f(x_1, \cdots, x_n) = \sum_{i,j}a_{ij} x_i x_j 
\pause
      &=  a_{11}x_1^2 + 2\sum_{j\neq 1} a_{1j} x_1x_j + g'(x_2, \cdots, x_n) \\
\pause
    &= a_{11}\left( x_1^2 + 2 \cdot x_1\cdot \frac{\sum_{j\neq 1} a_{1j} x_j}{a_{11}} + \left( \frac{\sum_{j\neq 1} a_{1j} x_j}{a_{11}} \right)^2\right) \\
\pause
    &\quad  -  \frac{\left( \sum_{j\neq 1} a_{1j} x_j \right)^2}{a_{11}}
     + g'(x_2, \cdots, x_n) \\
\pause
  &= a_{11} \left( x_1 + \frac{\sum_{j\neq 1} a_{1j} x_j}{a_{11}} \right)^2 + g(x_2, \cdots, x_n),
  \end{aligned}
\]
  \end{enumerate}
\end{block}

\end{frame}

\begin{frame}
  \begin{block}{配方法（续）}
\begin{enumerate}
\pause
  \item （情形 1 续）
\onslide<+->{%pause
  其中
  \begin{align*}
    g'(x_2, \cdots, x_n)&=  \sum_{i,j\geqslant 2} a_{ij}x_ix_j,\\
    g(x_2, \cdots, x_n)&=  -  \frac{\left( \sum_{j\neq 1} a_{1j} x_j \right)^2}{a_{11}}
    + g'(x_2, \cdots, x_n).
  \end{align*}
}%\pause
  \onslide<+->{%pause
    令
    \[
      x_1 + \frac{\sum_{j\neq 1} a_{1j} x_j}{a_{11}}=y_1, \quad x_i=y_i ~\text{(对$i\neq 1$)},
    \]
  }%pause
\onslide<+->{%pause
    亦即
    \[
      x_1=y_1-\frac{\sum_{j\neq 1} a_{1j} y_j}{a_{11}}, \quad x_i=y_i ~\text{(对$i\neq 1$)},
    \]
  }%pause
\onslide<+->{%pause
  我们就得到了想要的形式$a_{11}y_1^2+g(y_2,\cdots,y_n)$.
  }%pause
\onslide<+->{%pause
\item 情形 2：所有$a_{ii}=0$. 不妨设二次型中有$x_ix_j$这项。令$x_i=y_1+y_2, x_j=y_1-y_2$,且$x_k=y_k$ (对$k\neq i,j$） 那么可以归结到情形(1)。 
}%pause
\end{enumerate}
\end{block}
 
\end{frame}

\begin{frame}


  尽管上述证明中情形2 (无平方项) 的处理方法作为证明方法很明快，
  实际计算中有另一种更有效的处理方法。
 不妨设$a_{12}\neq 0$. 先观察做个合适的分解$2a_{12}=c_1c_2$.
那么$2a_{12}x_1x_2+\sum_{j=3}^n 2a_{1j} x_1x_j + \sum_{j=3}^n 2a_{2j} x_2x_j$可唯一地写为
\[
\begin{aligned}
  2a_{12}x_1x_2 & + \sum_{j=3}^n 2a_{1j} x_1x_j + \sum_{j=3}^n 2a_{2j} x_2x_j \\
  &=   \left(c_1x_1 + \sum_{j=3}^n c_{1j}x_j\right) \left( c_2x_2+ \sum_{j=3}^n c_{2j}x_j \right) - \left( \sum_{j=3}^n c_{1j}x_j \right) \left( \sum_{j=3}^n c_{2j}x_j \right),\\
  \text{其中} \hspace{2em} & 
  c_{1j}=2a_{2j}/c_2\, (j=3,\cdots,n),\quad 
  c_{2j}=2a_{1j}/c_1\, (j=3,\cdots,n).
\end{aligned}
\]
因此，$f(x_1,\cdots,x_n)$可写为
\[
  f(x_1,\cdots,x_n)=(c_1x_1+l_1(x_3,\cdots,x_n))(c_2x_2+l_2(x_3,\cdots,x_n)) + f'(x_3,\cdots,x_n),
\]
其中$l_1(x_3,\cdots,x_n), l_2(x_3,\cdots,x_n)$为$x_3,\cdots,x_n$的一次齐次多项式。
再接着处理$f'(x_3,\cdots,x_n)$. 当我们这样处理情形2时 (情形1的处理如上述证明中),
我们可以做到：\emph{只引入一次新文字就可实现通过非退化的线性替换把任一二次型化为标准形}。
最终做线性替换时，可令
\[
\begin{cases}
  c_1x_1+l_1(x_3,\cdots,x_n)=y_1+y_2\\
  c_2x_2+l_2(x_3,\cdots,x_n)=y_1-y_2\\
  \qquad\vdots
\end{cases}
\]

\end{frame}

 


\begin{frame}

  \begin{example}\label{1C0}
    考虑二次型
    \[
      f(x_1,x_2,x_3,x_4) = 2x_1^2+3x_2^2+4x_3^2-x_4^2-4x_1x_2+8x_1x_3-2x_2x_3+6x_3x_4.
    \]
    \pause
    我们来用配方法来化此二次型为标准形：
    \pause
    \[
    \begin{aligned}
      f(x_1,x_2,x_3,x_4) 
    &= 2\left( x_1^2 + 2x_1\cdot (-x_2+2x_3) \right) +\left( 3x_2^2+4x_3^2-x_4^2 -2x_2x_3+6x_3x_4 \right) \\
\pause
    &= 2\left( x_1^2 + 2x_1\cdot (-x_2+2x_3) + (-x_2+2x_3)^2 \right)  -2 (-x_2+2x_3)^2\\
\pause
    & \hspace{1em} +\left( 3x_2^2+4x_3^2-x_4^2 -2x_2x_3+6x_3x_4 \right)  \\
\pause
    &= 2\left( x_1 -x_2+2x_3\right)^2 + \left(  x_2^2-4x_3^2+6x_2x_3 -x_4^2+6x_3x_4 \right)\\
\pause
    &= 2\left( x_1 -x_2+2x_3\right)^2 + (x_2+3x_3)^2 + (-x_4^2+6x_3x_4-13x_3^2) \\
\pause
    &= 2\left( x_1 -x_2+2x_3\right)^2 + (x_2+3x_3)^2 -(x_4-3x_3)^2 -4x_3^2\\
\pause
    &= 2\left( x_1 -x_2+2x_3\right)^2 + (x_2+3x_3)^2 -(x_4-3x_3)^2 -4x_3^2.
  \end{aligned}
\]
这样令
\[
  \setlength{\arraycolsep}{1pt}
  \left\{\begin{array}{rl}
    x_1-x_2 \phantom{+?_?}+2x_3 &=   y_1\\
    x_2\phantom{+?_?}+3x_3 &=  y_2 \\
    x_4-3x_3 &=  y_3 \\
    x_3&=  y_4,
  \end{array}
\right.
\pause
\quad \text{亦即}\quad
  \begin{cases}
    x_1= y_1+y_2-5y_4\\
    x_2= y_2-3y_4\\
    x_3= y_4 \\
    x_4=y_3+3y_4
  \end{cases}
\]
\end{example}
\end{frame}


\begin{frame}
  \addtocounter{theorem}{-1}
  \begin{example}[续]
(通过回代求解把每个$x_i$表示成$y_1,y_2,y_3,y_4$的线性组合)， 那么
\[
  f(x_1,x_2,x_3,x_4)=2y_1^2+y_2^2-y_3^2-4y_4^2.
\]
\pause
这样二次型$f$就被化成了标准形。
  \end{example}

%\pause
%  \begin{remark*}
%  情形 1 中的$g(x_2,\cdots,x_n)$可能还符合情形 1 的设定（即有平方项），
%  此时我们不必急着做上述情形 1 中所说的线性替换，
%  而是可以就地对 $g(x_2,\cdots,x_n)$ 配方。
%\pause
%  不仅如此，只要一直都是满足情形 1 的设定（即有平方项），
%  我们可以一直就地配方而暂不引入新变量。
%  上例便是如此。
%\pause
%  为何这样可行呢？
%\pause
%  我们最终做的形如上例中线性替换($*$)，若用矩阵的形式写为$CX=Y$, 
%\pause
%那么容易发现适当排序这些$x_i$后 (如上例中令$X=(x_1,x_2,x_4,x_3)^{\rT}$) 
%可使得$C$是个对角线上都是非零数的上三角矩阵。
%\pause
%特别地，$C$总可逆 (即便不重排$x_i$)。
%  这样我们的线性替换$X=C^{-1}Y$是非退化的。
%  %如此，总的线性替换亦非退化。
%\pause
%要写出线性替换$X=C^{-1}Y$, 通过回代求解形如($*$)的线性方程组即可，因为增广矩阵$\begin{pmatrix}
%  C & Y
%\end{pmatrix}$已然是阶梯形矩阵。
%\end{remark*}

  \pause
  \begin{example}\label{1C1}
   我们换一种形式用配方法来把例~\ref{1C3}~中二次型化成标准形：
\[
\begin{aligned}
f(x_{1}, x_{2}, x_{3})&=  2 x_{1} x_{2}+2 x_{1} x_{3}-6 x_{2} x_{3}\\
&=  (2x_1-6x_3 )(x_2+x_3) + 6x_3^2.
\end{aligned}
\]
因此，令
\[
  \begin{cases}
    2x_1-6x_3= y_1+y_2\\
x_2  +x_3 =  y_1-y_2\\
x_3 = y_3,
  \end{cases}
  \quad\text{即}\quad
  \begin{cases}
    x_1=\frac{1}{2}y_1+\frac{1}{2}y_2+3y_3\\
    x_2=y_1-y_2-y_3\\
    x_3=y_3,
  \end{cases}
\]
二次型$f$被化成了标准形
\[
  f(x_1,x_2,x_3)=y_1^2-y_2^2+6y_3^2.
\]
\end{example}
\end{frame}

\begin{frame}
  \begin{example}\label{1C2}
考虑二次型
\[
  f(x_1,x_2,x_3,x_4,x_5) = x_1x_3-2x_1x_5+3x_2x_4+x_2x_5+x_3x_4+x_4x_5.
\]
 我们来用配方法来化此二次型为标准形：
\[
\begin{aligned}
  f(x_1,x_2,x_3,x_4,x_5)&= x_1x_3-2x_1x_5+3x_2x_4+x_2x_5+x_3x_4+x_4x_5 \\
  &= (x_4-2x_1+x_2)(x_5+3x_2+x_3)-(-2x_1+x_2)(3x_2+x_3)+x_1x_3\\
  &= (x_4+x_1+x_2)(x_5+x_2+x_3) + 3x_1x_3 +6x_1x_2 + x_2x_3 -3x_2^2 \\
  &=  (x_4+x_1+x_2)(x_5+x_2+x_3) + (3x_1+ x_2)(x_3 + 2x_2)-5x_2^2.
\end{aligned}
\]
令
\setlength{\arraycolsep}{1pt}
\[
  \left\{
  \begin{array}{rrrrrl}
    x_4 & & +x_1 & & +x_2&= y_4-y_5 \\
    & \phantom{+} x_5 & & +x_3 & +x_2&= y_4+y_5 \\
  &&  \phantom{+} 3x_1& & + x_2&= y_1-y_3 \\
& & & x_3 & + 2x_2&= y_1+y_3 \\
 & & & & x_2&= y_2,
  \end{array}\right.
  \quad \text{即}\quad
  \begin{cases}
    x_1=\frac{1}{3} y_1 -\frac{1}{3}y_2 -\frac{1}{3} y_3\\
    x_2=y_2 \\
    x_3=y_1-2y_2+ y_3\\
x_4=-\frac{1}{3} y_1-\frac{2}{3}y_2 + \frac{1}{3} y_3+ y_4-y_5\\
x_5=-y_1+y_2-y_3+y_4+y_5,
  \end{cases}
\]
则
\[
  f(x_1,x_2,x_3,x_4,x_5)=y_1^2-5y_2^2-y_3^2+y_4^2-y_5^2.
\]
  \end{example}
\end{frame}

\begin{frame}
  我们来说明下例~\ref{1C2}~的线性替换非退化，这个说明一般地可行。
  令
  \[
    X'=(x_4,x_5,x_1,x_3,x_2)^{\rT},\quad 
  Y'=(y_4,y_5,y_1,y_3,y_2)^{\rT}.
\]
  那么$C_1X'=C_2Y'$, 其中$C_1$为对角线上元素都非零的上三角形矩阵，
  $C_2$为对角线上或为非零数或为$\begin{pmatrix}
    1 & -1 \\ 1 & 1
  \end{pmatrix}$的准对角阵。
  显然$C_1,C_2$都可逆，故线性替换$X'=C_1^{-1}C_2Y'$非退化。
  这样重排文字得到的线性替换$X=CY$也非退化，
  因为$X', Y'$可视为$X, Y$分别左乘一些 (对应于交换两行这个初等变换的) 初等矩阵得到。
  (实际上，
  \[
    C_1'= \begin{pmatrix}
      1 & 0 & 1 & 0 & 1\\
       & 1 & 0 & 1 & 1\\
       && 3 & 0 & 1\\
       &&& 1&2\\
       &&&& 1
     \end{pmatrix},\quad 
     C_2'=\begin{pmatrix}
       1 & -1 \\
       1 & 1\\
       && 1  & -1 \\
       && 1 & 1 \\
       &&&& 1
   \end{pmatrix}.)
  \]
自己类似地想想为何例~\ref{1C0}~和~\ref{1C1}~中线性替换非退化。
\end{frame}


\begin{frame}{用对称版本的初等变换化二次型为标准形 (直接把做法呈现出来，不细讲)}
  \pause
  课本讲了配方法后把配方法用矩阵的语言写出来，这很自然。不过下面是纯粹从矩阵的角度分析证明的，
  即我们来证明对称矩阵可经过合同变换变成对角阵。

\pause
  设二次型$f(x_1, \cdots, x_n)$对应的对称矩阵为$A$.
\pause
  我们想要找可逆矩阵$C$使得$C^{\rT}AC$是对角阵。
\pause
  注意到可逆矩阵可写为一些初等矩阵的乘积，比如$C=Q_1Q_2 \cdots Q_s$, 其中$Q_i$是初等矩阵，
  \pause
  那么
  \[
    C^{\rT}AC=Q_s^{\rT} \cdots Q_2^{\rT} Q_1^{\rT} A Q_1 Q_2 \cdots Q_s
    =Q_s^{\rT}\left( \cdots \left(Q_2^{\rT}\left( Q_1^{\rT} A Q_1\right) Q_2\right) \cdots \right)Q_s.
  \]
\pause
  这样``合同对角化$A$''的过程也相当于``若干次通过初等矩阵做合同变换来实现对角化''的过程。
\pause
我们也把``通过初等矩阵做合同变换''，即$\Cong_Q$（其中$Q$是初等矩阵），说成是\emph{对称版本的初等变换}。
\pause
  从初等矩阵左乘或右乘的效果可知，对称版本的初等变换是：做了一次$c_i+c_j\times a$（转：$c_i \times c$, $c_i\leftrightarrow c_j$），
  那么我们要相应地做一次$r_i+r_j\times a$（转：$r_i \times c$, $r_i\leftrightarrow r_j$）。
  \pause
  这里初等列变换与其相应的初等行变换我们称为对称的操作，
\pause
亦即初等列变换与初等行变换称为\emph{对称} (symmetric)，若实现这两个变换的初等矩阵相差个转置。

\pause
通常我们要做多次的对称版本的初等变换。
\pause
当然，最终的结果还是合同变换，因为合同变换的复合还是合同变换。
\pause
  同时，结合律告诉我们
  \[
    (Q_k^{\rT}\cdots Q_2^{\rT} Q_1^{\rT}) A (Q_1 Q_2\cdots Q_k) =
    Q_k^{\rT}\left( \cdots \left(Q_2^{\rT}\left( Q_1^{\rT} A Q_1\right) Q_2\right) \cdots \right)Q_k,
  \]
  \pause
  因此，``做了几次初等列变换然后相应地把对应的初等行变换依次做完''跟``做几次对称版本的初等变换''有相同的效果。
\end{frame}

\begin{frame}{}
  从操作的渐进目标而言，对角化$A$的过程如下：
    \pause
  先把$A$通过一系列对称版本的初等变换化成$\begin{pmatrix}
    a_{11}' \\ & A'
  \end{pmatrix}$的形式，
\pause
  接着对$A'$做类似的过程，不断地重复下去，直到把$A$变成对角阵。
\pause
  要把$A$通过一系列对称版本的初等变换化成$\begin{pmatrix}
    a_{11}' \\ & A'
\end{pmatrix}$的形式，具体的操作我们还需要分情况来讨论：
\pause
  \begin{enumerate}
    \item 若$a_{11}\neq 0$, 做若干次初等列变换，
      通过$a_{11}$把所有的$a_{1j}$ ($j>1$) 清零。
\pause
      相应的行变换恰好把$a_{j1}$ 清零。
\pause
    \item 若$a_{11}\neq 0$但某个$a_{ii}\neq 0$, 
      那么做对称版本的初等变换$c_1\leftrightarrow c_i, r_1\leftrightarrow r_i$后
      得到的对称矩阵第$(1,1)$位元素非零。
\pause
      可接着按情况(1)中所述进行。
\pause
    \item 若所有的$a_{ii}=0$, 我们不妨设某个$a_{1j}\neq0$ (否则已然是$\begin{pmatrix}
    a_{11}' \\ & A'
  \end{pmatrix}$的形式）。
\pause
  做初等变换$c_1+c_j, r_1+r_j$（或初等变换$c_1+\frac{1}{2}c_j, r_1+\frac{1}{2}r_j$）
  后得到的对称矩阵第$(1,1)$位元素非零。
\pause
  可接着按情况(1)中所述进行。
  \end{enumerate}
\pause
  那么，我们如何写出合同变换所用的矩阵呢？
\pause
  我们构造矩阵$\begin{pmatrix}
    A\\ E
  \end{pmatrix}$, 对此矩阵做一系列对称版本的初等变换，把$A$变成对角阵时，
  容易发现{\verify}下面的$E$就变成了我们想要的合同变换的矩阵。
\end{frame}

\begin{frame}
  \begin{example}
    考虑二次型
$
f\left(x_{1}, x_{2}, x_{3}\right)=2 x_{1} x_{2}+2 x_{1} x_{3}-6 x_{2} x_{3}
$.
\pause
其矩阵为
\[
  \renewcommand{\arraystretch}{1}
A=\left(\begin{array}{rrr}
0 & 1 & 1 \\
1 & 0 & -3 \\
1 & -3 & 0
\end{array}\right)
.
\]
\pause
我们对$\begin{pmatrix}
    A\\ E
  \end{pmatrix}$做一系列对称版本的初等变换把$A$变成对角阵最终可得（见下一页）
  \[
\begin{pmatrix}
    A\\ E
  \end{pmatrix}\xrightarrow[\text{初等变换}]{\text{对称版本的}}
  \begin{pmatrix}
    D \\ C
  \end{pmatrix}
\pause
  =
\left(\begin{array}{rrr}
2 & 0 & 0 \\
0 & -\frac{1}{2} & 0 \\
0 & 0 & 6 \\
\hline
1 & -\frac{1}{2} & 3 \\
1 & \frac{1}{2} & -1\\
0 & 0 & 1
\end{array}\right).
  \]
\pause
由此可知 $C^{\rT} A C =D$, 
这样经过线性替换$X=CY$,
\pause
即
  \[
    \begin{pmatrix}
      x_1 \\ x_2 \\x_3 
    \end{pmatrix}= \begin{pmatrix}
      1 & -\frac{1}{2} & 3 \\
1 & \frac{1}{2} & -1\\
0 & 0 & 1
    \end{pmatrix}\begin{pmatrix}
      y_1 \\ y_2 \\ y_3
    \end{pmatrix},
  \]
  \end{example}
\end{frame}

\begin{frame}{}
  \addtocounter{theorem}{-1}
  \begin{example}[续]
  二次型$f$被化为了标准形：
  \[
    f(x_1, x_2, x_3)= 2y_1^2-\frac{1}{2}y_2^2+6y_3^2.
  \]
\pause
        化简$\begin{pmatrix}
          A\\ E
        \end{pmatrix}$的过程如下：
        \[
        \begin{aligned}
    \left(\begin{array}{rrr}
0 & 1 & 1 \\
1 & 0 & -3 \\
1 & -3 & 0 \\
\hline
1 & 0 & 0 \\
0 & 1 & 0\\
0 & 0 & 1
\end{array}\right) 
\pause
\xrightarrow[r_1+r_2]{c_1+c_2} 
\pause
& 
\left(\begin{array}{rrr}
2 & 1 & -2 \\
1 & 0 & -3 \\
-2 & -3 & 0 \\
\hline
1 & 0 & 0 \\
1 & 1 & 0\\
0 & 0 & 1
\end{array}\right) 
\pause
\xrightarrow[{r_2+r_1\times(-\frac{1}{2}), r_3+r_1}] {c_2+c_1\times(-\frac{1}{2}), c_3+c_1} 
\pause
\left(\begin{array}{rrr}
2 & 0 & 0 \\
0 & -\frac{1}{2} & -2 \\
0 & -2 & -2 \\
\hline
1 & -\frac{1}{2} & 1 \\
1 & \frac{1}{2} & 1\\
0 & 0 & 1
\end{array}\right) \\
\pause
\xrightarrow[r_3+r_2\times(-4)]{c_3+c_2\times(-4)} & 
\pause
\left(\begin{array}{rrr}
2 & 0 & 0 \\
0 & -\frac{1}{2} & 0 \\
0 & 0 & 6 \\
\hline
1 & -\frac{1}{2} & 3 \\
1 & \frac{1}{2} & -1\\
0 & 0 & 1
\end{array}\right).
  \end{aligned}
\]
  \end{example}

\end{frame}

\begin{frame}{对称版本的分块形式的初等变换 (上课不讲)}
  \pause
  化简二次型的矩阵时我们的初等变换也可以是分块形式的。
\pause
三类分块形式的初等变换的对称变换（初等行变换与初等列变换称为\emph{对称}，若实现它们的矩阵相差个转置）分别为：
  \begin{enumerate}
    \item $c_i+c_j\times M$的对称操作为$r_i+M^{\rT} \times r_j$.
      \pause
    \item $c_i \times C$（其中$C$可逆）的对称操作为$C^{\rT} \times r_i$.
      \pause
    \item $c_i\leftrightarrow c_j$的对称操作为$r_i\leftrightarrow r_j$.
  \end{enumerate}
  \pause
  为了简单，我们只象征性地写出一些对$2\times 2$分块的分块矩阵做这些操作时实现的矩阵：
  \pause
  \begin{enumerate}
    \item $c_1+c_2\times M$相当于右乘$\begin{pmatrix}
        E & \\ M &E
      \end{pmatrix}$, $r_1+ M^{\rT}\times r_2$相当于左乘$\begin{pmatrix}
        E & M^{\rT} \\ & E
      \end{pmatrix}$.
      \pause
    \item $c_1\times C$相当于右乘$\begin{pmatrix}
        C \\ & E
      \end{pmatrix}$, $C^{\rT} \times r_1$相当于左乘$\begin{pmatrix}
        C^{\rT} \\ &E 
      \end{pmatrix}$.
      \pause
    \item $c_1\leftrightarrow c_2$相当于右乘$\begin{pmatrix}
        & E\\ E 
      \end{pmatrix}$, $r_i\leftrightarrow r_j$相当于左乘$\begin{pmatrix}
        & E\\ E
      \end{pmatrix}$.
  \end{enumerate}
  \pause
  显然对称版本的分块形式的初等变换是合同变换。%除了分块的操作自然地出现，不需要知道实现合同变换的矩阵具体何样时我们这样写比较省略。

  ~

  %下面的例子中我们同时用分块形式的与通常形式的初等变换，
  %所以为了以示区别，我们用分别$R_i, C_i$表示分块矩阵的第$i$行，第$i$列。
  \pause
  下面这个例子中%我们恢复了例~\ref{1C3}~中配方法的结果，其中
  我们应用了公式
  \[
    \begin{pmatrix}
      1 & 1 \\
      1 & -1 
    \end{pmatrix}\begin{pmatrix}
      0 & 1 \\
      1 & 0
    \end{pmatrix}\begin{pmatrix}
      1 & 1 \\
      1 & -1 
    \end{pmatrix}
    =\begin{pmatrix}
      2 \\ & -2
    \end{pmatrix}.
  \]
\pause
  这是之前的例子中配方法化$2x_1x_2$这个二次型为标准型的矩阵形式。
\end{frame}

\begin{frame}
  \begin{example}
    考虑二次型
$
f\left(x_{1}, x_{2}, x_{3}\right)=2 x_{1} x_{2}+2 x_{1} x_{3}-6 x_{2} x_{3}
$.
令其矩阵为$A$, 令$M=\begin{pmatrix}
  1 & 1\\ 1 & -1
\end{pmatrix}$.
\pause
对$\begin{pmatrix}
    A\\ E
  \end{pmatrix}$做对称的（分块形式的）初等变换把$A$占的块变成对角阵：
  \pause
     \[
       \begin{aligned}
    \left(\begin{array}{rr|r}
0 & 1 & 1 \\
1 & 0 & -3 \\
\hline
1 & -3 & 0 \\
\hline
1 & 0 & 0 \\
0 & 1 & 0\\
\hline
0 & 0 & 1
\end{array}\right) 
&= 
 \begin{pmatrix}
  A_{1} & \alpha \\
  \alpha^{\rT} & 0\\
  E_2 & 0 \\
  0 & 1
\end{pmatrix} 
\xrightarrow[\substack{r_2- \alpha^{\rT}A_1^{-1}\times r_1\\ M^{\rT}\times r_1}]{\substack{c_2-c_1\times A_1^{-1}\alpha\\ c_1\times M}} 
\left(
\begin{array}{ccc}
2 \\ &  -2 \\  && 6\\
\hline
1 & 1 & 3 \\
1 & -1 & -1 \\
0 & 0 & 1
\end{array}\right)=  \begin{pmatrix}
    D \\ C
  \end{pmatrix}.
\end{aligned}
\]
\pause
由此可知 $C^{\rT} A C =D$, 
\pause
这样经过线性替换$X=CY$, 
\pause
即
  \[
    \begin{pmatrix}
      x_1 \\ x_2 \\x_3 
    \end{pmatrix}= \begin{pmatrix}
1 & 1 & 3 \\
1 & -1 & -1\\
0 & 0 & 1
    \end{pmatrix}\begin{pmatrix}
      y_1 \\ y_2 \\ y_3
    \end{pmatrix},
  \]
  二次型$f$被化为了平方和：
  \(
    f(x_1, x_2, x_3)= 2y_1^2-2y_2^2+6y_3^2.
  \)
\end{example} 
\end{frame}

\iffalse
\begin{frame}{标准形存在性的证明（初等变换法）}
  \pause
  令$A=(a_{ij})$为$n$阶对称矩阵。
  \begin{enumerate}
    \item 若$a_{11}\neq 0$, 记 
      \[
        A=\begin{pmatrix}
          a_{11} & \alpha^{\rT} \\ \alpha &A_1
        \end{pmatrix},
      \]
其中$\alpha$是列向量，$A_1$是$n-1$阶矩阵。那么我们可作如下的初等变换：
\[
\begin{pmatrix}
          a_{11} & \alpha^{\rT} \\ \alpha &A_1
        \end{pmatrix}\xrightarrow[r_2+r_1\times (-\frac{1}{a_{11}}\alpha)]{c_2+ c_1\times (-\frac{1}{a_{11}}\alpha^{\rT})}
        \begin{pmatrix}
          a_{11} \\ & A_1-a_{11}^{-1} \alpha\alpha^{\rT}
        \end{pmatrix}.
\]
\item 若$a_{11}=0$, 而$a_{ii}\neq 0$, 初等变换$c_i\leftrightarrow c_1, r_i\leftrightarrow r_1$后
  新的的对称矩阵的$(1,1)$元素非零，转化为情形(1).
\item 若$a_{ii}=0$, 对任意的$i$, 而$a_{ij}\neq0$, 不妨设$a_{12}\neq 0$, 
令
\[
  A=\begin{pmatrix}
    
  \end{pmatrix}<++>
\]
  那么
  我们可作如下的初等变换：
  \[

  \]
  \end{enumerate}<++>
  
\end{frame}
\fi


\begin{frame}{小结}
  \pause
  \begin{enumerate}
    \item 如何有效地通过配方将一个二次型写成平方和的样子？举例说明要处理的情形，及举出完整计算的例子。
      \pause
    \item 如何通过初等变换把对称矩阵合同对角化？举例说明。
      \pause
      如何有效地写出合同变换所需的可逆矩阵？
  \end{enumerate}
\end{frame}
